智能论文笔记

提出了一种表示每个数据集的消化信息的方法，以创新思想的帮助以及试图使用或组合数据集创建有价值的产品，服务和业务模型的数据用户的通信。与通过共享属性（即变量）连接数据集的方法相比，此方法通过在现实世界中应活跃的情况下通过事件，情况或操作连接数据集。该方法反映了每个元数据对特征概念的适应性的考虑，这是预期从数据中获得的信息或知识的摘要；因此，数据的用户获得了适合真实企业和现实生活需求的实践知识，以及将AI技术应用于数据的基础。

translated by 谷歌翻译

我们提出了一个框架，该框架会自动将不可缩放的GNN转换为基于预典型的GNN，该GNN对于大型图表有效且可扩展。我们框架的优势是两倍。1）它通过将局部特征聚合与其图形卷积中的重量学习分开，2）通过将其边缘分解为小型图形，将其有效地在GPU上进行了预先执行，将各种局部特征聚合与重量学习分开，将各种局部特征聚合从重量学习中分离出来，从而使各种不可估计的GNN转换为大规模图表。和平衡的集合。通过大规模图的广泛实验，我们证明了转化的GNN在训练时间内的运行速度比现有的GNN更快，同时实现了最先进的GNN的竞争精度。因此，我们的转型框架为可伸缩GNN的未来研究提供了简单有效的基础。

translated by 谷歌翻译

Beyond Real-world Benchmark Datasets: An Empirical Study of Node Classification with GNNs

Seiji Maekawa , Koki Noda , Yuya Sasaki , Makoto Onizuka

分类：机器学习

2022-06-18

图神经网络（GNN）在节点分类任务上取得了巨大成功。尽管对开发和评估GNN具有广泛的兴趣，但它们已经通过有限的基准数据集进行了评估。结果，现有的GNN评估缺乏来自图的各种特征的细粒分析。在此激励的情况下，我们对合成图生成器进行了广泛的实验，该实验可以生成具有控制特征以进行细粒分析的图形。我们的实证研究阐明了带有节点类标签的真实图形标签的四个主要特征的GNN的优势和劣势，即1）类规模分布（平衡与失衡），2）等级之间的边缘连接比例（均质VS之间）异性词），3）属性值（偏见与随机），4）图形大小（小与大）。此外，为了促进对GNN的未来研究，我们公开发布了我们的代码库，该代码库允许用户用各种图表评估各种GNN。我们希望这项工作为未来的研究提供有趣的见解。

translated by 谷歌翻译